Gemini Kendi Kazmış olduğu Çukura Düştü: Açık Açık Kandırıldı!

0 1 dakika okuma süresi

Gemini’ye yönelik saldırılarda modelin kendi eğitim sürecindeki geri bildirim mekanizmasından faydalanıldığı ortaya kondu.

Araştırmacılar, Google’ın yapay zekâ modeli Gemini’yı kandırmanın garip bir yolunu keşfetti. Üstelik bunu yaparken Gemini’nin kendi “ince ayar” hususi durumunu kullandılar. Şu demek oluyor ki yapay zekâya, adeta kendi silahıyla tuzak kurdular.

Normalde işe yaramayan komut hileleri, bu yöntemle aniden etkili hale geliyor. Yöntemin adı ise oldukça keyifli: “Fun-Tuning”. Bu yaratıcı yaklaşım, ABD’deki UC San Diego ve Wisconsin Üniversitesi’nden araştırmacılar tarafınca geliştirilmiş.

Yapay zekâ kendi verdiği geri bildirimlerle kandırıldı

Yöntemde, etkisiz kalan komut enjeksiyonlarının başına ve sonuna rastgele ifadeler eklendikten sonra saldırılar güçlendirildi. Araştırmacılar, “wandel ! ! ! !” ya da “formatted ! ASAP !” benzer biçimde ifadelerle çevrelenen hücum metinlerinin Gemini’nin yanıtlarını manipüle edebildiğini ortaya koydu.

Araştırma ekibi, geliştirdikleri yöntemin Gemini 1.5 Flash modelinde %65, Gemini 1.0 Pro modelinde ise %82 oranında başarı sağladığını paylaştı. Aynı saldırıların değişik Gemini modellerinde de benzer şekilde işe yaradığına dikkat çekti. Bu başarıda, modelin eğitim sürecinde verdiği geri bildirimlerin direkt kullanılması etkili oldu.

Google, söz mevzusu yöntemle ilgili direkt bir izahat yapmadı. Şirket, yapmış olduğu genel açıklamada bu tür saldırılara karşı müdafa mekanizmaları geliştirmenin öncelikli mevzular içinde yer aldığını beyan etti. Araştırmacılar ise bu probleminin kolay çözülemeyeceğini dile getirdi. Zira saldırının temelinde, Gemini’ın ince ayar özelliğiyle çalışan ve özelleştirilebilirliğini elde eden yapının yer aldığına dikkat çekti.

0 1 dakika okuma süresi

Bir yanıt yazın Yanıtı iptal et

Carolyn Donnelly
Hi, this is a comment. To get started with moderating, editi...
Donald Allbright
Hi, this is a comment. To get started with moderating, editi...
James Kim
Hi, this is a comment. To get started with moderating, editi...
Donald Allbright
Hi, this is a comment. To get started with moderating, editi...
Ernest Baker
Hi, this is a comment. To get started with moderating, editi...

Waze Navigation & Live Traffic v4.96.50.501Beta APK Free Download

Apple boşuna kendi modemini üretmemiş: iPhone 17 ile iPhone 16’nın Wi-Fi hız karşılaştırması paylaşıldı

Intel “Panther Lake” İşlemciler Duyuruldu

WhatsApp Messenger v2.23.3.3 [Beta] APK Free Download

Microsoft’un Reddettiği Office Uygulama Logoları Ortaya Çıktı (Felaketin Kıyısından Dönülmüş)

Mercedes-Benz, Şehirler Arası Yolculuklarda Kullanılacak İlk Elektrikli Otobüsünü Tanıttı

FotMob Pro – Soccer Scores v161.10379.20230207 [Paid] APK Free Download

LED Keyboard: Emoji, Fonts v16.3.12 [Pro] APK Free Download

Restaurant Point of Sale | Cash Register -W&O POS v12.10.2 [Unlocked] APK Free Download

Google Haritalar’a, Yollarda Dönüşü Kaçırma Sorununu Tarihe Gömecek Özellik Geliyor

iPhone’un Bildirimleri İki Kere Göndermesinin Sebebi Ne? Iyi mi Kapatılır?

GPX Viewer PRO v1.41.2 [Patched] APK Free Download

Gemini Kendi Kazmış olduğu Çukura Düştü: Açık Açık Kandırıldı!

Gemini’ye yönelik saldırılarda modelin kendi eğitim sürecindeki geri bildirim mekanizmasından faydalanıldığı ortaya kondu.

Yapay zekâ kendi verdiği geri bildirimlerle kandırıldı

Bir yanıt yazın Yanıtı iptal et

OTT Navigator IPTV v1.6.9.3 Beta [Google Play Store Version] [Mod] APK Free Download

Tarascon Pharmacopoeia v3.28.2.1886 [Subscribed][Unlocked] APK Free Download

BlackPlayer EX v20.62 build 405 [Beta] [Patched] [Mod Extra] APK Free Download

How much can I spend? v1.22 [Paid] APK Free Download

YouTube’a, 2025’te En Oldukca İzlediğiniz Videoları Gösteren İlk Senelik Özetleri Duyurdu

Fortnite Oyuncuları, Oyun İçinde Suni Zekâ Görselleri Kullanılmasına İsyan Etti

Gemini, Kamera ve Ekranı Canlı Olarak İzleyebilecek

Google Translate’ten Tercümanları İşsiz Bırakacak Özellik: Tüm Kulaklıklar Gerçek Zamanlı Tercüme Yapabilecek

Sam Altman’dan OpenAI’ın Yapay Zeka Aleti Hakkında Izahat: “iPhone’dan Daha Mütevazi ve Daha Rahat”

Lock in now! Stock sell-off sinks mortgage rates

Spieth in danger of missing cut

One swallow does not make the spring

Gemini’ye yönelik saldırılarda modelin kendi eğitim sürecindeki geri bildirim mekanizmasından faydalanıldığı ortaya kondu.

Yapay zekâ kendi verdiği geri bildirimlerle kandırıldı

Tax, Tip, Travel & Splits Calculator v2.2.0 [Mod] APK Free Download

2025 Steam Güz İndirimi: 10 Dolar Altına Alabileceğiniz Oyunlar

İlgili Makaleler

Bir yanıt yazın Yanıtı iptal et

OTT Navigator IPTV v1.6.9.3 Beta [Google Play Store Version] [Mod] APK Free Download

Tarascon Pharmacopoeia v3.28.2.1886 [Subscribed][Unlocked] APK Free Download

BlackPlayer EX v20.62 build 405 [Beta] [Patched] [Mod Extra] APK Free Download

How much can I spend? v1.22 [Paid] APK Free Download

YouTube’a, 2025’te En Oldukca İzlediğiniz Videoları Gösteren İlk Senelik Özetleri Duyurdu

Fortnite Oyuncuları, Oyun İçinde Suni Zekâ Görselleri Kullanılmasına İsyan Etti

Gemini, Kamera ve Ekranı Canlı Olarak İzleyebilecek

Google Translate’ten Tercümanları İşsiz Bırakacak Özellik: Tüm Kulaklıklar Gerçek Zamanlı Tercüme Yapabilecek

Sam Altman’dan OpenAI’ın Yapay Zeka Aleti Hakkında Izahat: “iPhone’dan Daha Mütevazi ve Daha Rahat”

Lock in now! Stock sell-off sinks mortgage rates

Spieth in danger of missing cut

One swallow does not make the spring